home *** CD-ROM | disk | FTP | other *** search
/ MacWorld 1998 January / Macworld (1998-01).dmg / Shareware World / Comms & Internet / Convert Cyrillic HTML 2.1 / For use with PowerReplace / Read me first < prev    next >
Text File  |  1997-09-30  |  3KB  |  81 lines

  1. Convert Cyrillic HTML files with PowerReplace
  2. v. 2.1
  3.  
  4.  
  5.  
  6. These “filters” are intended for use with PowerReplace (info-mac/text/power-replace-625.hqx  at any Info-Mac mirror <news:comp.sys.mac.digest>). They enable you to convert Cyrillic HTML files between different character sets used on the Internet <http://www.fingertipsoft.com/ref/cyrillic/charsets.html>, namely:
  7.  
  8. • MacCyrillic
  9. <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/CYRILLIC.TXT>
  10. <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/UKRAINE.TXT>
  11.  
  12. • ISO-IR-111  (commonly known as KOI-8 or KOI8 and most widely used for Russian and Ukrainian)
  13. <ftp://dkuug.dk/i18n/charmaps/ECMA-CYRILLIC>
  14. <http://www.fingertipsoft.com/ref/cyrillic/isoir111.html>
  15.  
  16. • ISO-8859-5  (= ISO-IR-144)
  17. <ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-5.TXT>
  18.  
  19. • Windows-1251  (i.e. Code Page 1251)
  20. <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1251.TXT>
  21.  
  22. • IBM866  (i.e. Code Page 866)
  23. <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/PC/CP866.TXT>
  24.  
  25. • Unicode
  26. <http://www.unicode.org/>
  27.  
  28. Thereby you need to write your Cyrillic HTML files only with “native” Macintosh fonts but you can present them on the WWW in other encodings. Please note that these filters do not convert text files into HTML files. They just change the encoding of the Cyrillic characters using Unicode as an intermediate.
  29.  
  30.  
  31. What to do?
  32.  
  33. (1)  Put the filters into your PowerReplace folder.
  34.  
  35. (2)  Start PowerReplace and select the appropriate filter from the menu “Filter”:
  36.  
  37. • “MacCyrillic –> Unicode# html”
  38.  
  39. • “ISO-IR-111 –> Unicode# html”
  40.  
  41. • “ISO-8859-5 –> Unicode# html”
  42.  
  43. • “Windows-1251 –> Unicode# html”
  44.  
  45. • “IBM866 –> Unicode# html”
  46.  
  47. Convert HTML files from MacCyrillic, ISO-IR-111 (KOI-8), ISO-8859-5, Windows-1251, or IBM866 to Unicode. All non-ASCII characters are converted to the form “А” — except that the box drawing characters from IBM866 drop out.
  48.  
  49. • “Unicode# –> MacCyrillic html”
  50.  
  51. • “Unicode# –> ISO-IR-111 html”
  52.  
  53. • “Unicode# –> ISO-8859-5 html”
  54.  
  55. • “Unicode# –> Windows-1251 html”
  56.  
  57. • “Unicode# –> IBM866 html”
  58.  
  59. Convert HTML files from Unicode (written in the form “А”) to MacCyrillic, ISO-IR-111 (KOI-8), ISO-8859-5, Windows-1251, or IBM866.
  60.  
  61. (3)  Choose the menu “Control : Convert File…”. Alternatively, drag the HTML files that you want to convert onto the PowerReplace icon in the Finder.
  62.  
  63. (4)  If you want to convert an HTML file from MacCyrillic to KOI-8, for example, then you convert first with “MacCyrillic –> Unicode# html” and afterwards with “Unicode# –> ISO-IR-111 html”.
  64.  
  65. (5)  You can specify the character set of an HTML file in a META header:
  66. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=x-mac-cyrillic">
  67. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-ir-111">
  68. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-5">
  69. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1251">
  70. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ibm866">
  71.  
  72.  
  73.  
  74. Please read first the documentation that comes with PowerReplace before you ask me any further questions!
  75.  
  76.  
  77.  
  78. September 1997
  79. Andreas Prilop
  80. <mailto:pri@mac1.rrzn.uni-hannover.de>
  81.